Národní úložiště šedé literatury Nalezeno 6 záznamů.  Hledání trvalo 0.00 vteřin. 
Extrakce vícejazyčných valenčních rámců ze závislostních korpusů
Faryad, Ján ; Zeman, Daniel (vedoucí práce) ; Lopatková, Markéta (oponent)
Vícejazyčné valenční slovníky poskytují užitečné informace o shodě valenčních rámců (sloves a jejich argumentů) v různých jazycích. Tato práce se zaměřuje na vývoj programu, který automaticky vytvoří vícejazyčný valenční slovník na základě paralelních korpusů anotovaných podle Universal Dependencies. Tato úloha zahrnuje jednojazyčnou extrakci valenčních rámců a jejich propojení napříč jazyky. Jsou analyzovány a implementovány různé metody řešení. Práce zahrnuje jak obecný, jazykově nezávislý přístup, tak dodatečná, jazykově specifická rozšíření, poskytnutá konkrétně pro angličtinu, češtinu a slovenštinu. Metody propojování valenčních rámců zahrnují použití slovního zarovnání, morfologické a syntaktické informace obsažené v anotaci UD nebo podobnosti sloves mezi příbuznými jazyky. Kvalita řešení je zhodnocena několika zave- denými metrikami na ručně anotovaných datech nebo porovnáním s existujícím valenčním slovníkem. 1
Consistency of Linguistic Annotation
Aggarwal, Akshay ; Zeman, Daniel (vedoucí práce) ; Lopatková, Markéta (oponent)
Thesis Abstract Akshay Aggarwal July 2020 This thesis attempts at correction of some errors and inconsistencies in dif- ferent treebanks. The inconsistencies can be related to linguistic constructions, failure of the guidelines of annotation, failure to understand the guidelines on annotator's part, or random errors caused by annotators, among others. We propose a metric to attest the POS annotation consistency of different tree- banks in the same language, when the annotation guidelines remain the same. We offer solutions to some previously identified inconsistencies in the scope of the Universal Dependencies Project, and check the viability of a proposed in- consistency detection tool in a low-resource setting. The solutions discussed in the thesis are language-neutral, intended to work with multiple languages with efficiency. 1
Využití syntaktické informace pro identifikaci hodnocených entit
Glončák, Vladan ; Hajič, Jan (vedoucí práce) ; Helcl, Jindřich (oponent)
Identifikace hodnocených entit (Opinion Target Extraction, OTE) je zavedená pod-úloha analýzy sentimentu. Zatímco detekce subjektivních výroků a určení jejich polarity (pozitivní, nebo negativní) je samo o sobě užitečné, schopnost identifikovat i tyto "cílové" entity poskytuje mnohem kvalitnější podklady pro rozhodování: majitelka restaurace potřebuje vědět, jestli si hosté stěžují na obsluhu, jídlo, atmosféru, či další aspekty jejího podniku, atp. Ačkoliv tato úloha má stále silnou lexikální složku, je zde i velký potenciál využít obecných syntaktických konstrukcí v evaluativních výrocích: v jedné větě například může být potenciálních cílových entit více, a přiřazení správného cíle k hodnotícímu výroku tak je záležitostí správného rozlišení v syntaktické struktuře věty. Syntaktické vzorce spojené s evlauativními výroky již byly popsány. Tato diplomová práce si klade za cíl zkoumat, jak přítomnost syntaktické informace ovlivňuje na úloze extrakce cílových entit (OTE) chování state-of-the-art modelů strojového učení, jako například rekurentních neuronových sítí. Nepodařilo se nám najít žádné přesvědčivé důkazy, které by nasvědčovaly, že přítomnost syntaktické informace výrazně ovlivňuje chování zvolených modelů.
Tvorba závislostního korpusu pro jorubštinu s využitím paralelních dat
Oluokun, Adedayo ; Zeman, Daniel (vedoucí práce) ; Rosa, Rudolf (oponent)
The goal of this thesis is to create a dependency treebank for Yorùbá, a language with very little pre-existing machine-readable resources. The treebank follows the Universal Dependencies (UD) annotation standard, certain language-specific guidelines for Yorùbá were specified. Known techniques for porting resources from resource-rich languages were tested, in particular projection of annotation across parallel bilingual data. Manual annotation is not the main focus of this thesis; nevertheless, a small portion of the data was verified manually in order to evaluate the annotation quality. Also, a model was trained on the manual annotation using UDPipe.
Syntaktická analýza textů se střídáním kódů
Ravishankar, Vinit ; Zeman, Daniel (vedoucí práce) ; Mareček, David (oponent)
Vinit Ravishankar Červenec 2018 Tato diplomová práce si klade dva cíle. Za prvé, snažíme se zkonstruovat závislostní syntaktický analyzátor (parser), který lze aplikovat na korpusy se střídáním kódů, přestože byl natrénován pouze s použitím jednojazyčných ko- rpusů. Kromě vlastní implementace parseru tedy experimentujeme se škálou metod, které se snaží vylepšit naivní výsledek (baseline), získaný prostým natrénováním modelu na jednojazyčných korpusech. Tyto metody zahrnují modifikaci korpusů a modifikaci neuronových sítí uvnitř parseru. Účinnost parseru vyhodnocujeme na dvou jazykových párech: hindština/angličtina a komijština/ruština. Pro většinu evaluačních kritérií se nám na těchto testo- vacích datech podařilo dosáhnout nejlepšího známého výsledku. Významně jsme překonali námi stanovený naivní výsledek, jakož i většinu publikovaných výsledků pro podobné úlohy v odborné literatuře. Druhá část práce se věnuje dosud málo prozkoumané úloze predikce pozic v jednojazyčné výpovědi, kde by mohlo dojít k přepnutí kódu. Navrhujeme několik architektur, které takové body označují, doufajíce, že se stanou výchozím bodem pro budoucí výzkum. 1
Rozpoznávání koreference pro Universal Dependencies
Faryad, Ján ; Novák, Michal (vedoucí práce) ; Rosa, Rudolf (oponent)
Název práce: Rozpoznávání koreference pro Universal Dependencies Autor: Ján Faryad Ústav: Ústav formální a aplikované lingvistiky Vedoucí bakalářské práce: Mgr. Michal Novák Abstrakt: Koreference je důležitým prostředkem pro udržení soudržnosti textu. V univerzálním popisu morfologie a závislostní syntaxe Universal Dependencies (UD) však dosud chyběla možnost jejího vyznačení. Práce představuje způsob, jak koreferenci v projektu UD značit. Součástí práce je i převod dat s anotací koreference z korpusů PDT 3.0 a OntoNotes 5.0 za pomoci nástroje UDPipe pro automatickou analýzu textu ve stylu UD. Práce se dále zabývá implementací systému pro automatické rozpoznávání koreference zájmen pomocí strojového učení. Nakonec je jednoduchým způsobem vyhodnocena úspěšnost systému. Při návrhu programu je kladen důraz na jazykovou nezávislost a kompatibilitu s rozhraním Udapi používaným pro práci s UD. Klíčová slova: rozpoznávání koreference, koreference, anafora, Universal Dependencies, UD

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.